ENEM: Escolhendo variáveis

Devido ao tamanho grande do arquivo (=~ 7GBs), variáveis são selecionadas na leitura


In [6]:
setwd("~/TCC/Dados/ENEM 2014/DADOS")
varEnem14 <- c("NULL","NULL",NA,"NULL",NA,NA,"NULL","NULL","NULL","NULL","NULL","NULL",NA,"NULL","NULL",NA,NA,NA,"NULL","NULL","NULL","NULL",NA,"NULL","NULL","NULL",NA,NA,"NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL",NA,"NULL","NULL","NULL",NA,NA,NA,NA,"NULL","NULL","NULL","NULL",NA,NA,NA,NA,"NULL","NULL","NULL","NULL",NA,"NULL","NULL","NULL","NULL",NA,"NULL","NULL","NULL","NULL","NULL",NA,"NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL", "NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL","NULL")
enem14 <- read.table("MICRODADOS_ENEM_2014.csv", header = T, sep=",", colClasses = varEnem14)

In [7]:
enem14 <- subset(enem14, ST_CONCLUSAO==1 | ST_CONCLUSAO==2) #Concluiu o Ensino Médio ou irá concluir em 2014
enem14 <- subset(enem14, IN_PRESENCA_CN==1 & IN_PRESENCA_CH==1 & IN_PRESENCA_LC==1 & IN_PRESENCA_MT==1)
enem14 <- subset(enem14, IN_STATUS_REDACAO==7)

Tirando as variáveis utilizadas acima


In [8]:
enem14$ST_CONCLUSAO <- NULL
enem14$IN_PRESENCA_CN <- NULL
enem14$IN_PRESENCA_CH <- NULL
enem14$IN_PRESENCA_LC <- NULL
enem14$IN_PRESENCA_MT <- NULL
enem14$IN_STATUS_REDACAO <- NULL

In [10]:
enem14Federal <- subset(enem14, ID_DEPENDENCIA_ADM_ESC==1)
enem14Estadual <- subset(enem14, ID_DEPENDENCIA_ADM_ESC==2)
enem14Municipal <- subset(enem14, ID_DEPENDENCIA_ADM_ESC==3)
enem14Privada <- subset(enem14, ID_DEPENDENCIA_ADM_ESC==4)
enem14Publica <- subset(enem14, ID_DEPENDENCIA_ADM_ESC!=4)
#write.csv2(enem14Federal, "[1]enem14Federal--v3--15-11-2016.csv")
#write.csv2(enem14Estadual, "[1]enem14Estadual--v3--15-11-2016.csv")
#write.csv2(enem14Municipal, "[1]enem14Municipal--v3--15-11-2016.csv")
write.csv2(enem14Privada, "[1]enem14Privada--v3--15-11-2016.csv")
write.csv2(enem14Publica, "[1]enem14Publica--v3--15-11-2016.csv")
write.csv2(enem14, "[1]enem14--v3--15-11-2016.csv")

In [ ]:


In [ ]: